北京大学数字人文工作坊全文纪要:数字与文学的对话——数字人文范式对传统文学研究方法的挑战
本文删节版原载《中国现代文学研究丛刊》2020年第8期。
整理者:项蕾、许婷、谭天、雷宁、蔡翔宇
-----------------------------------
时间:2020年5月8日14:00-17:00
主持人:邵燕君
主办人:王军
嘉宾:姜文涛、邱伟云、赵薇
评议人:杨玲、徐爽、王玉玊
提问人:高寒凝、项蕾等
------------------------------------邵燕君(主持人):
自从数字文明兴起以来,建立在印刷文明“基础设施”(infrastructure)上的人文学科大厦就已经开始动摇。数字人文作为一种新的研究方法对人文学科的传统研究方法构成全面挑战。在这一轮挑战中,文学研究领域或许可称“最后的堡垒”。这不仅由于文学的意蕴是最难用数字计算的,也是因为,文学研究的背后矗立着一个具有神圣意味的“伟大传统”。文学研究者一直具有经典阐释者的身份,经典的命名权和阐释权是构成文学系合法性的基石。
就中国现当代文学研究界的实际情况来说,传统的阐释学研究范式和思维模式仍然具有很深的响力。虽然1980年代中期以后,英美“新批评”方法引入,并被奉为圭臬,但中国研究界真正接受的“新批评”方法主要是“韦勒克、沃伦式”的,而非“瑞恰慈式”的。韦勒克、沃伦在《文学原理》中,将文学研究分为“内部研究”和“外部研究”,目的是强调文本的独立性,其“本学本体论”概念,为当时中国当代文学摆脱意识形态限制、向“纯文学”方向发展提供了理论支持。但在实际批评实践中,“外部研究”的要素仍会被拿来作为解读作品的钥匙。而所谓的“文本细读”(close reading)在很多时候,只是一种“文本精读”,或者运用各种现代文艺理论(如精神分析、女权主义等)进行的深度阐释,而非瑞恰慈所做的通过“基本英语”这样的“统计系统”,来获得关于诗歌阐释的没有主体情感的透明、简单的意义——那一路的文本细读其实和莫莱蒂提出的远读(distant reading)有亲缘关系。1990年代后期,文化研究的方法被引入,政治、经济等要素不再作为“外部研究”,而成为隐藏在文本内部的“症候”。
总之,目前在中国现当代研究界居于主流的模式,是一种深度解读模式,在文本细读(主要是文本精读和深度理论阐释)+文化研究式“症候式阅读”的背后,传统阐释批评的思维模式,依然是根深蒂固的底层逻辑。如今,这种深度模式受到了数字人文研究方法的全方位挑战。数字人文提出了一系列拆解式的对照性概念。如定量研究/定性研究,质化阐释/量化阐释,幸存者偏差/选择性偏差, 文本细读/远读,经典性文本/档案文本非经典性文本,典型人物/扁平人物,主要人物/次要人物,症候性阅读/表层阅读等。这些概念的提出不但拆解了传统研究方法的“深度模式”,也把其盲区呈现出来,展现了数字人文内在的民主性和科学性。
面对数字人文的挑战,作为传统的文学研究者难免是惶恐且不快的。这不仅由于自身的身份将发生改变——从具有文化使命感的意义阐释者转变为谦逊的分析者和观察者——而是确实能感觉得原有研究方法的局限——精英霸权的自我中心,主观判断的不证自明,以及肉眼凡胎的无能为力。我们能回避数字人文的冲击吗?显然不能。因为构成我们学科大厦的印刷文化基础设施已经改变。然而,接受数字人文的方法,文学研究会不会丧失其独特的灵性?文学研究是不是会进一步社科化?整个人文研究会不会计算机化?接着来的问题必然是,什么是好的数字人文研究?我们该如何把传统文学研究推向“好”的路径上去?这里要再度祭出麦克卢汉的观点。半个世纪之前,麦克卢汉就提出,在媒介革命来临之际,要使人类文明得到良性继承,需要深通旧媒介“语法”的文化精英们以艺术家的警觉去了解新媒介的“语法”,从而获得引渡文明的能力。
所以,今天的文学研究者,尤其是文学研究者面临着全新的挑战,不但得懂专业,还得懂数字技术,还得具备跨学科的人文素养。一个好的数字人文研究者,不但要以数字人文为“器”,还要以数字人文为“思”。但首先要保证,这把利器要是掌握在“内行”人手中。我们只有主动去学习数字人文的新语法,才能把数字人文研究的新范式嫁接在原有的研究方法上,使其成为文学研究的加强版、升级版,将印刷文明阶段数百年积累的成果方法加上数字的引擎。如果我们一味拒斥,麻木不仁,一旦整个学术研究发生系统性转型,未及内部转型的学科就可能在“降维打击”中被格式化。
最后,向大家介绍本次研讨论坛的嘉宾与评议人。姜文涛老师,任职于浙江大学国际联合学院人文社会科学研究中心,主要研究方向为漫长的18世纪印刷文化和情感研究、比较文学和文艺理论。姜老师关于数字人文文学研究的论述,试图从既有的文学批评学科史脉络来勾勒数字人文的文学批评方法。邱伟云老师,台湾政治大学文学博士,山东大学历史文化学院历史学系副研究员。邱老师是做历史的,历史在数字人文是个先行的学科,邱老师今天将提供一个先驱学科先行者的学术示范。赵薇老师,任职于中国社会科学院文学研究所,曾在芝加哥大学的纽伯尔文化与社会科学院文本光学实验室做研究,现在也参与其中一些项目,她真正把数字人文落实到了既有的现当代文学研究中去。评议人杨玲老师,厦门大学中文系副教授,是最早针对网络文学阅读方法,向我们团队介绍远读等的老师。评议人徐爽老师,巴黎狄德罗大学-巴黎七大研究员,将为我们提供一个国际化的新的视野。评议人王玉玊,中国艺术研究院助理研究员,也是《文艺理论与批评》此前数字人文专题的编辑。向老师们学习!
姜文涛(嘉宾):
我的演讲主要分为三个部分,第一部分是我在数字人文学科上的组织性工作,第二部分是我所做的数字人文研究性工作和切入数字人文的学术经历,第三部分重点讲述我近期的研究成果。
我所做的组织性工作主要有两项。
一是与美国威斯康辛-麦迪逊大学亚洲语言与文化系助理教授戴安德(Anatoly Detwyler)合作,在《山东社会科学》上开设学术专栏“数字人文:观其大较”。专栏始于2016年,至今已有6期,每期都有主题,围绕着主题发表一组文章。这些文章主要分为两类,一类是科普型文章,展示北美数字人文领域的研究概况;另一类是有代表性的研究型文章,旨在激起国内学界重视与讨论。其二是作为编辑,参与了清华大学与中华书局主办的《数字人文》双语季刊。该刊物于2020年1月正式发行。
然后介绍一下我的学术研究工作。我主要的研究方向是英国的“漫长的18世纪”(即1660-1832年)文学文化研究,也就是在英国社会逐步现代化的背景下,英语文学作为一个专业,如何在大学体系内建立的过程。在这段时期,印刷文化浸入英国人的日常社会生活,影响了人们的感知方式,推动情感文学产生新发展,这也是我在旧作《情感美学与近代文本文化的兴起》里想要探讨的内容。而作为中国人,研究外国文学的时候,我很自然想到了本国文学同期的发展。所以我的研究方向还包括比较文学,主要是明清时期印刷技术与情感文学的关系。
印刷文化与现代文学研究体制的建立,本质上是新媒介、新技术对文学研究的影响,这也是我开始关注和研究数字人文的原因之一。另一个原因是受到了纽约大学英美文学系的教授Clifford Siskin的影响。这位教授主要研究英国“漫长的18世纪”里,印刷技术如何影响写作与文学。他的视角对我也有很大启发。
转到这个领域后,我发表了一些数字人文领域文章,包括《数字人文作为一种方法:西方研究现状及展望》(戴安德、姜文涛撰,赵薇译,2016,山东社会科学)《数字人文文学研究与近代文学的兴起——以北美文学研究学科史为中心的文献学考察》(2018,文化研究)《作为一种文学研究方法的数字人文——印刷文化基础设施,20世纪文学批评史,以及文学社会学》(2019,中国比较文学)《什么是好的数字人文》(2019,澳门理工学报)。这些文章主要介绍了什么是数字人文,旨在帮助新入行的研究者尽快了解这门学科。其中,《什么是好的数字人文》提出了数字人文研究应具备的七条标准:人文学术意识、社会科学素养、学术史及学科史的视野、数字方法和技能、数据意识、反思性、开放性与协作性。对于当下的文学研究来说,数字人文技术提出的最大挑战,就是“数字方法和技能”与“数据意识”。传统的文学研究里,其余几项也是有可能具备的,唯独这两项是数字人文独有的,也是我们必须从头学起的。另外,最近我觉得“可重复性”也可以添加进去作为一条数字人文研究的标准,因为数字人文是文科与理工科的交叉学科,理工科注重可重复性,那么数字人文也应具备这一标准。
空谈标准过于抽象。所以我再提供一篇具有范例性质的数字人文学科论文,供大家参考:Economics, Race, and the Postwar US Novel: A Quantitative Literary History(Daniel Sinykin, Richard Jean So, and Jessica Young,American Literary History, vol. 31, no. 4, 2019),这篇文章用数字人文的方法进行文化批评研究,条理清晰,要素齐全,很有代表性,近期我会翻译过来,发表在《数字人文》季刊上,供大家学习参考。
再来谈谈我的另一篇论文:《作为一种文学研究方法的数字人文——印刷文化基础设施,20世纪文学批评史,以及文学社会学》。这篇文章的题目很大,主要目的是为数字人文正名。文章的路径是寻找数字化时代之前的、历史上的、关于数字的文学批评方法,比如俄罗斯形式主义,再比如新批评前的某些文学批评方法,这些批评观点都对数字、技术、可重复性有所涉及,只不过在新批评崛起之后,它们都被掩盖了下去。所以现在一些从事文学批评史研究的学者开始重新挖掘历史,寻找新批评之前那些使用计算、计量或数字的文学批评方法。我再推荐一篇论文,可以与我这篇文章相互参看,就是美国哥伦比亚大学英文系副教授Dennis Yi Tenen于2019年发表在Modern Philology上的文章The Emergence of American Formalism。这篇论文认为,在俄罗斯形式主义出现之前,美国文学批评界的部分学者已经开始探索类似的观点,这些学者重视技巧、可重复性,反对浪漫主义的天才论,也可视作是数字人文的前驱。
除了我刚刚提及的中国古代文学与西方文学两个领域,现当代文学也可以用数字人文进行研究,比如台湾清华大学于治中的《现代性与“文学”的诞生——从朱自清与现代文学学科的创建谈起》(《文学评论》),就对这个问题做出了探讨。
近些年,人文学研究在西方再度兴起,一系列相关杂志与协会陆续出现。我想,这意味着我们这个学科已经走向了新的历史转折点,量的积累已经足够,急需新的研究方法和思想来推动整个学科完成质变,数字人文正当其时。
最后我要引用澳大利亚数字人文学者Katherine Bode的话作为结尾:“文学的意义不是单一的,而是社会构成性地锻造而成。在这个社会里,特定时刻中特定范式(历史的、哲学的、心理学的、社会学的,现在是统计学)的突出地位塑造了我们所知的一切和理解这一切的方式。任何情况下,学科的纯洁性都无法保护贫乏的方法论。跨学科性能增加方法论意识。”
希望我们大家都能重新思考一下,在数字时代下,面对新文本、新材料与新技术,我们究竟应该用什么样的方法去研究人文学科,让它焕发出新的生机。谢谢大家!
邱伟云(嘉宾):
主办人王老师、主持人邵老师,与谈人姜老师、赵老师、杨老师、徐老师、王老师,以及线上诸位师友们大家好。很高兴收到王老师与邵老师的邀请,能来参与这个由北大数字人文研究中心举办的“数字与文学的对话——数字人文范式对传统文学研究方法的挑战”线上研讨会。
我常说,我们生存在一个奇点处处的时代,这是很令人兴奋的,因为我们这时代的人们所面对的事情,在过去是百年一遇,然而如今我们则是十年一遇甚至五年一遇。世界在美国经济学家莱维特(Levitt)于1983年提出的globalization“全球化”,英国社会学家鲍曼在2000年提出的Liquid Modernity“流动的现代性”,以及英国社会学家汤林森在2010年提出的The Culture 0f Speed“速度社会”下,正在快速不断的纠缠与变化之中。在现代这个世代中,已不再能以过去“以不变应万变”的心态面对各种新的挑战,应当成为“随波逐流”者,永远保持追逐新知的心情,才能永远作为后浪与巨浪,推动着我们民族与国家的发展。
今天邵老师分派的任务是讨论数字与文学之间的关系。过去我在数字人文研究中,主要工作是数字概念史的相关研究,亦即结合自然语言处理技术中的文本探勘方法与德国的概念史研究法,对长时段的历史或文学文本进行快读、远读与共读的工作,这样的方法,可以运用至研究政治概念、艺术概念、经济概念,当然也可以使用至文学概念上的研究,因此如我提供给大家阅读资料中陈硕文老师的“文艺”概念研究就是一个例子,该文使用了文本探勘方法探索“文艺”概念在近代巨量资料库的演变轨迹。另外还提供了清华大学刘知远与孙茂松老师等人使用词向量方法,以及政治大学刘昭麟老师等运用自然语言处理方法进行古代诗文以及当代报刊为材料进行语义概念研究的论文。今天我主要想从文学研究者,应以何种准备心态去与数字技术交流这点上来说说自己的看法。
刚才前述所提到数字人文研究中有着快读、远读与共读三点特征,这个提法是武汉大学王晓光老师与南京大学陈静老师,在今年2月25日发表在《人民日报》上一篇名为《数字人文打开文化新视野(高峰之路)》的主张,亦即认为数字人文方法得以帮助人文研究者,相较于过去,能加快阅读和利用文献资料的速度,能聚焦比文本小很多或大很多的单位,如手法、主题、修辞、文类或体系的考察,能进行时间跨度上较大或素材量较多的研究,能结合微观与宏观视野,既帮助学者在纷繁庞杂的信息中快速发现和定位议题,在宏观的学科脉络中把握关键问题,又可以发挥个人学养所长,深刻探究问题所在,解释背后的义理与规律,两位老师为数字人文方法所总结出的快读、远读与共读三视野,是我目前寓目所及,对数字人文研究方法特点总结的最好的提法之一,而两位老师所总结出的三种数字人文研究视野优势,也同时是数字人文能够增益文学研究方法的重点关键所在。
请大家注意,这里我用的关键词是“增益文学研究方法”这个说法,而非“取代传统文学研究方法”,因为在数字人文研究者的世界中,尤其是在华人数字人文学界,是不存在如美国的那种物竞天择,适者生存的研究方法新陈代谢论的。因此今天我的分享,就主要会围绕著“数字人文范式与传统文学研究方法”的关系这点来讨论。而讨论两者的关系甚为重要,因为在历史学界中,目前仍然存在著“传统历史研究方法”与“数字史学研究方法”的挑战论述框架,这对于发展全体视野下历史研究法而言是有所损伤的,因为等于是先设的抹煞了数字人文作为历史研究法的可能性,然而学术是公器,是多元的,应当让各种方法并呈,不应有方法学的主次强弱之分,这样才能推进学科研究的前沿。既然在历史学界中有这样的问题,在文学研究界中也可能会出现,那么今天我就想藉由这个机会,把一个我觉得较好的数字人文方法与传统学科方法的关系框架提出来,以使数字人文方法将来在文学研究界中能够发展的更为顺利,这是我将今天与谈题目定为“文学研究方法花园里的数字之花”的关怀所在。
在场的主要都是文学研究界的前辈先进,所以我想“什么是文学研究”这个问题,想必大家都能回答,那么,什么是文学研究呢?这个问题很大,每个人的答案都不能视之为错误的,但每个人的答案乃至于某种立场的答案却是有主题性的,例如北大学人与清华学人,古典文学与现代文学乃至网络文学研究者,对于这个问题都会有不同的答案。如果我们进一步问,作为古典文学研究顶级期刊的《文学遗产》、作为现代文学研究顶刊的《文学评论》,作为跨领域研究顶刊的《文史哲》杂志,他们各自对于“文学研究”的理解是不是相同?相同点何在?不同点何在?大家能回答出来吗?
相信在场的各位文学研究工作者可以回答出来,但是所回答的答案,都是一种“印象式的回忆与结论”,这种结论会有其正确性,但却也会因为不同的文学名家的印象不同而有所差异,因此就会造成似乎各述己志的结果,当然这是好的,因为在全体史视野下,让不同的诠释与论述多元齐放,正是趋近真实的最好途径,因此过去的印象式研究法与结论当然有其存在的合法性,只是在此我想多问一句,如果可以通过数字技术,客观的重演三种顶刊对于文学研究的理解异同,这样的结论是否也有其合法性?若有,那么大家可以看看以下三张简报。
在第一张《文学遗产》的“文学”概念之花中,连结的最大关键词节点是中国文学史、诗歌、章回小说、版本、古代经典小说等;而在第二张《文学评论》的“文学”概念之花中,较大的连结关键节点是意识型态、现代性、民族、现实主义、知识分子、思维形式、个性心理特徵、民族、权力主体、马克思主义等;而在第三张《文史哲》的“文学”概念之花中,较大的连结节点则是作家、政治、劳动、艺术、剥削阶级、资产阶级、诗人、日本等;
从上面三张我通过citespace软体,巨量的计算了《文学遗产》自1980到2020年40年间共5403篇文章的关键词,以及《文学评论》自1959年至2020年61年间共6470篇文章的关键词,乃至于《文史哲》自1951年到2020年69年间共6150篇文章的关键词后,我们得以快速的给出过去顶级学者过目不忘能力下的印象式结论,甚至更为精确的给出三顶刊对于「文学」概念理解的异同,从此得以揭示出我们中国文学研究学界中对于「文学」概念的多重理解,藉以回望过去,展望将来。从此一例中即可回应前述指出的「快读」功能,上述数据的下载以及计算、绘制,我用了六小时就完成了,假使不使用数字人文技术,那么比较三顶刊对于「文学」概念理解的差异此一问题,又需要用多久时间做出来呢?又或是这种题目在一开始就受限于人力所不能及,也就不会被当做问题意识提出来呢?通过这一例子我想说的是,采用数字人文研究法,能够让我们开发出过去所无法想像与讨论的问题,这对文学研究发展而言,必定是一种有力且有效的「增益」。
而在上面我所举的这个例子之后,我想再问一个问题,那就是,今天「数字人文范式对传统文学研究方法的挑战」中的「传统文学研究方法」一词,各位师友认为什么是传统文学研究方法?是否有传统文学研究方法呢?预设著「传统文学研究方法」的存在对于整体的文学研究发展而言是促使其前进或是倒退呢?
在历史学界中,著名的历史学家霍布斯鲍姆(Eric Hobsbawm, 1917-2012)曾在1983年所写的The Invention of Tradition一书中,提出了「被发明的传统」这个概念,他说在什么情况下,传统的发明会更加频繁呢?那就是当社会的迅速转型削弱甚或摧毁了那些与“旧”传统相适宜的社会模式,并产生了旧传统已不再能适应的新社会模式时,或是当这些旧传统和它们的机构载体与传播者不再具有充分的适应性和灵活性,或是已被消除时,亦即当需求方或供应方发生了相当大且迅速的变化时。从霍布斯鲍姆的这段说法,我们意识到,「传统文学研究方法」概念被提出来,正是因为面临到旧传统和它们的机构载体与传播者,亦即指以印刷文明为主的文字史料载体与传播工具,在「全信息时代」下不再具有充分的适应性和灵活性的问题时被发明出来,正如IDC公司统计2011年全球被创见与复制的数据总量为1.8ZB,远远超过人类有史以来所有印刷材料数据总量200PB,专家更是预测,到2020年全球数据量较2010年将增加到43倍,达到35ZB,正是在这样从印刷文明转进到数字文明的奇点时刻,「传统」必须被提出。然而,是否在数字文明下,就不需要「传统文学研究方法」?其实不然,因为这里预设的所谓「传统文学研究方法」,就是指经由研究者通过经验阅读与分析的研究方法,那么,在数字人文视野下,即使使用了机器阅读帮助研究者进行快读,远读,不要忘了,最后我们还是要回到「共读」阶段,才算完成一段好的数字人文研究诠释循环。综上可见,即使未来我们转进到数字文明,被我们视为「传统文学研究方法」的经验式阅读分析方法仍然存在,因此我觉得数字人文方法对于整体文学研究而言是增益,并非是一种挑战。
既然如此,那么我想请大家思考几个问题:所谓「传统文学研究方法」是何时以及如何被发明的?我们是否需要标举“传统”与“非传统”文学研究方法的二元框架?在前述二元框架下“传统”与“非传统”是竞争的还是互助的呢?传统文学研究方法一词是否带有贬抑的意味?这些问题非常重要,因为我们对于这些问题的解答,将极大可能范定未来数字人文与文学研究的关系是取代还是互助关系。
霍布斯鲍姆也讨论了传统与非传统断裂之争,他说某些运动有意称自己是“传统主义者的”,并对那些通常被看做是历史连续性和传统之栖身处的团体具有吸引力,事实上,维护或恢复传统的运动的出现,无论其是“传统主义者的”或是别的什么,都已显示了传统与非传统的断裂,在浪漫主义以来的知识分子中已习以为常的这种运动,从来就不可能形成或是保存一种活的过去,而是必须成为“被发明的传统”。因此,我们是否要在数字人文与文学研究开始对话之际,就设定一个传统与非传统的二元挑战框架?或者是我们可以更为多元开放的为数字之花在文学研究方法花园中赏赐其一方天地呢?作为文学研究权威的各位师友们,选择权力在你们手上,你们决定了数字之花在文学研究方法花园中的盛开或枯萎,繁生或死绝,尽皆取决于你们现在所预设的框架。
虽然前面我非常肯定数字之花应该绽放于文学研究法花园中,但是我也不可否认,近来看到一些「伪」数字之花不断的被种植,造成文史研究界对于数字之花的怀疑与厌恶,而这些伪数字之花,正是造成传统与非传统二元框架在西方被树立起来的个中原因。因此在这我想接着从两个问题进行思考:我们是否需要一个断裂的传统与非传统文学研究方法的说法与主张?为什么需要?为什么不需要呢?传统与非传统文学研究方法的二元框架是因何而起?背后又隐藏著什么力量呢?
传统与非传统二元框架的兴起,乃是来自于一些有着数字外表却无人文精神的塑料数字之花,什么叫做塑料数字之花,就是毫无人文精神于其中,徒有数字炫技外表的研究,而这正是2014年美国学者哥伦比亚大学美国学研究中心的亚当•克思奇(Adam Kirsch,1976-),他在著名的The New Republic杂志上发表的Technology Is Taking Over English Departments: The False Promise of the Digital Humanities一文中所批评的对象。该文力批某些数字人文倡导者的极端立场,流露出对传统人文核心价值的挑战乃至颠覆,如轻文字重图像,轻思想重制作,轻创作重编码,等等。
那么问题又来了,西方在学术市场经济与话语霸权争夺之下的传统文学与数字文学之争,是否需要延续到中国来?具有和而不同传统价值的中国的文学研究界,是否需要类似克思奇所主张的取代论的二元框架?克思奇的观察与批评有道理吗?其实他说的有道理,因为最近我所审查的数字人文研究论文中,就出现很多这种塑料数字之花,这种花长得什么样子呢?
伪数字之花有三种特征,第一个特征是会有以今刑古的现象,从拿来主义出发,拿当代语料所训练出来的文本探勘工具去计算古代的词汇与情感,试问,古人与今人的用语与情感会一样吗?
第二个特征是会有想当然耳的问题,亦即有些数字人文研究专案,没有与人文学者合作,迳自拿数字工具去计算传统文学与历史史料,最后得出一批数据,直接从数据简约的做解释,未进行数字人文的诠释循环,亦即应从数据清理开始、计算数据,得出数据线索,回对史料,确认数据线索的正确或偏差,再决定修正工具或是直接就正确数据进行解释与结论的一套研究过程。如果未进行数字人文研究方法的诠释循环,就会出现如某一研究,仅就《全唐诗》文本计算后所得出的“渭河”与“鼓楼、玉树、秦岭、华清池”等语义共现结构就迳自进行解释,直言“渭河”时常与“鼓楼、玉树、秦岭、华清池”等语义共现。但当人文学者以此一计算后的语义结构为线索,回对《全唐诗》文本进行检证时,却发现「渭河」与“鼓楼、玉树、秦岭、华清池”等词在《全唐诗》中仅共现过一次,并无时常出现的现象,这一问题即出在研究者仅使用了数字工具进行快读与远读,而未与史料进行共读所致。这样一来,人文学者看見这朵伪数字之花,就必然对数字人文感到不信任而不愿意接受,因此進行数字人文研究之际必得经过前述的诠释循环,如此才能保证数字人文研究结果的可靠性。
第三个特征是老生常谈,亦即未能提出数字人文视野下的好问题。虽然在数字人文研究方法长处中,验证前人研究成果是一个亮点,但是不能仅止于验证前人说法,因为如此尚无法点出数字人文研究法的存在合法性与主体性。台湾大学数字人文中心主任项洁教授曾对数字人文研究进行过一个定义我觉得很好,他说数字人文,就是借助数字科技方能进行的人文研究,主要聚焦在研究前数字时代下难以观察、无法想象、无法进行的研究,换言之,所谓数字人文研究中好的问题,必须是过去无法想象的新问题。数字人文研究不能只是老调重弹,而必须要推陈出新,如此才能体现出数字人文研究法的存在主体性。
最后,我想提出一个思考,那就是中国语境中的数字人文研究者如何从跟风转到解决克思奇命题?特別是回到我们今天的主题—文学研究领域,我自己感觉有四个方向:第一,可以从文学的情感研究出发结合情感计算,纳入古今/国别/文化等人文思考于计算之中;第二,从文学的概念研究出发结合概念计算,纳入词频/共现/词向量/主题模型等多种方法,以及历史语境脉络等去进行更为多元的探勘工作,例如台湾政治大学文学院数字人文中心主任郑文惠教授曾以数字人文技术重探中国近代新旧论争就是一个较好的研究案例;第三,从文学的风格研究出发结合文本风格计算,纳入认知/行动/语境等人文思考于计算之中;第四,从文学的作者研究出发结合作者计算,纳入血缘/姻缘/拟亲缘/地缘/业缘等人文思考于计算之中。之前请大家先阅读的就是一些我认为较好的结合数字方法的文学研究案例,另外还有天津大学何捷老师所带领的团队,在运用数字人文技术处理古典小说如《李娃传》等研究上也有很令人惊艳的成果可以参照。
只要我们能够在进行数字人文研究之际,时常保持人文学者的研究专技,就能避免种植出伪数字之花,那么,这研究专技是什么呢?南京大学历史学院数字史学研究中心主任王涛教授近期在《社会科学报》中发表了《发挥数字人文在史学研究中的效用》一文为我们揭示了答案,人文专技其实就是叙事与叙述力,只要我们常保对叙事与叙述的关照,就能避免种出塑料做的伪数字之花。希望在这次讨论后,能将数字与文学的关系从挑战论转向增益论,让文学研究方法花园中多开出一朵数字之花,让文学研究花园更为丰富多彩。
分享完毕,谢谢大家。
赵薇(嘉宾):
谢谢邵老师和王老师,让我有机会参与到这个话题中来。今天我要谈的是网络分析(Network Analysis),在这方面,王老师是网络分析的专家,最早做宋代政治网络研究的;邵老师的当代文学场研究,对场域思想的运用,早在十多年前就影响了我们这些学生,而文学网络分析的另一个代名词呢,其实就是量化的文学社会学研究;杨玲老师,更不必说,是最早对斯坦福文学实验室小册子进行准确解读的学者。所以在这几位面前谈这个问题,还是不敢当。
而往后看呢,同样道理。我一直觉得数字人文是一个不分“前浪”“后浪”的领域,我们的硕士研究生做的东西,不一定比教授差,只不过在面临“评价”的时候,可能会遭遇一些问题,就是我说的“跨学科的难度不仅来自于技术操作方面(单纯的技术难题其实并不成其为一个问题),而更多的源于评价机制,以及一些必须被充分讨论的方法论和概念前提。”(《计算创造力与计算批评》,《中国社会科学报》,2020年4月3日)而这个问题在文学研究中又会异常突出。在这里,我想简单说明的是,我可能更是一个“融合”论者,也就是说,数字人文和“传统人文”之间,也许并不是对抗的关系,相反,我们今天能够谈论的所有“新问题”,肯定是由“传统”中生长出来的,有其自身的合理性。“学科融合”是当今的一种趋势,我们所要做的就是要敢于最大限度地去融合不同领域的“传统”,去积极地寻找和搭建它们之间的“桥梁”。所以我今天就想从意识到的一些问题入手,结合自己的摸索经验,来从三方面谈谈关于“文学数字人文研究”的一点浅见。由于是谈最基本的认识,所以还是主要用自己的,或自己熟悉的例子比较方便。
首先是问题意识,大家强调得很多了,就是说我们数字人文研究,虽然具备一定的开放性和探索性,但是在相当长的阶段内仍然需要较强的问题意识来指引,背后需要有真问题。我个人觉得文学研究不仅仅是听凭数据驱动或方法冲动,特别是在数据量不够大,数据质量不够理想的时候。所谓“数字人文的文学研究”,它可能是那种大开大阖的“远读”,和讲究精致的审美“感兴”的文学阅读对冲得最激烈的地方。所以正如朱本军老师感慨的:“人文学的容错率其实并不亚于(不高于)自然科学”,文学研究在某些时候必然是一门高精确度的“知识驱动”的学问。那么,能否做到对问题史(批评史)的深入梳理;对研究对象的深入了解;对技术方法的起码了解(至少要知道有哪些可行的技术路径)就很重要了,这三者缺一不可。最高境界是要避免数字人文的工具化,在现阶段,问题和具体“技术”的对接则要充分考虑到方法的适用性。退一万步讲,能否从问题出发,而不单纯是从方法(技术)出发,即使最后的结果不甚理想,也可能是成功了一大半。
在这方面,我目前比较认同的研究都是不仅有方法意识,也是有问题意识的,这是一个问题与方法自然而然地相互寻找、对接的过程。我这两天又重温了一遍严程用网络形态对比来考证闺阁诗人交游情况的个案。感到她不仅有强烈的方法意识(面对文人交游唱和产生的巨量数据,该如何从中发现问题?),也有站得住脚的具体问题,即“秋红吟社的中断之谜”。至于说谁在前谁在后,这可能倒不是很重要,重要的是,我们读到她后来写成的文章,是一种所谓“远读”施展得比细读更“细”的“细读”。这是对对象和对象的研究史沉浸很久的明证。事实上,我们在读严承希、王军老师他们做的宋代政治网络研究的时候,也有这种感受,他们对当时政治家所处的情势的分析,如果没有对材料的深刻体认,是写不出来那样文章的。
如果简单回顾一下的话,我个人应该是在2015年准备博士论文的时候,对自己的研究对象李劼人产生了一些困惑,当时也似乎很能理解所谓“李劼人接受之谜”是怎么一回事了——为什么一个著述等身的大作家,却好像并没有获得相应的文学史地位——除了一些特定的历史原因外,我只是隐隐约约地感到,这可能和他的人物观,还有他在组织情节时对人物话语的过分倚赖有关。这种感受在阅读他的多卷本“大河小说”的过程中,在面对那种体量巨大,人物众多,社会关系纷繁复杂的“历史小说”的时候尤其强烈,或者说,就是对连篇累牍的对话成为连缀事件的主要手段,这样一种受到了近世章回体世情小说(而特别是晚清新小说)影响的文本组织形态,着实产生了畏惧感。而究其根底,其实我心里也很清楚,这又和作品真正要表现的主题——信息的流布,或者说是以人物对话为载体的小道蜚语在将保路运动推向武装革命中发挥的巨大作用有关。
所以我最初较关心的问题是,这么频繁的人物上下场和复杂对话,是否掩盖了凭我们一般意义上的故事阅读容易丢失的信息,一些掩盖了更深层次的叙事意图的地方?写了这么多人物是否真有必要?他们的功能还和古典小说一样吗?所以当时我是用Gephi中特殊的布局方式先将人物网络的分支结构表现出来。如图所示,可以看到旧版《大波》在由204人组成的网络中(这个人物规模和晚清小说《孽海花》持平),有一个100人的巨分支,还有96个出场人物处于和谁也不联通的独立分支中;到了重写版中,出场人物上升到570人(什么概念?一百万字的作品,我们平均读两页,就要认识一个新人物),然而独一无二的巨分支仍然只有120人,也就是说,剩下的四百多人,这些“零散”的“次要人物”大多在小说叙述或人物对话中一闪而过,他们浮桴于叙述话语的汪洋大海上,未能同那个“主要人物”的网络建立起有效的叙事关联。这就引发一个问题:为什么在作者的观念中,写一百来人,要有四百来人作“陪衬”?那些既作为功能元,又有性格的人物,到底占多少?我逐渐意识到,这是一个典型化,典型论的问题,而且,1950年代的读者也有相似的困惑。那么也就是说,从更大的角度看,在晚清小说体式向近现代“转型”的过程中,李劼人很可能是一个不可多得的样本,他写作的体式意义,要以怎样的解读方式,才能更直观的呈现出来?到底一种怎样的人物体系的形态特点,才能够协助他自如无误地表达他的旧民主主义革命观?这和所谓的自然主义又有什么关系?这些是我当时一点点摸索,才弄得清楚一些的“问题”。可以说是我的研究对象的独特性,在呼唤某种“量身定制”的方法,驱使我一步步走到了这种方法面前。
《大波》(1937)的人物规模和人物联通度
《大波》(重写本)的人物规模和人物联通度
非常巧的是,我当时受到了本科心理系师兄欧阳志平(也是一位神人)的一点影响,很自然地,就想用网络分析的办法来把纷繁复杂的叙述关系,“超出人们理解范围”的复杂关系做可视化。而当时几乎同时进入我视野的,是Franco Moretti(弗朗科•莫莱蒂)于前一年结集出版的批评文集Distant Reading(《远读》)。他在这本书的最后一章中,可以说是浅尝辄止地触及了一些网络分析的基本理念。他当时最大的一个局限是尚没有走到量化这一步,所以我们的研究就是要找到一个恰当的变量和计算方法,来衡量小说中所有人物之间的关系,建立关系型叙事网络。而台湾大学计算机系硕士生廖俊凡的研究之所以是有意义的,这里就涉及到今天的第二个问题,就是关键的中间概念和中间理论的问题。
这里我想强调的是,在开始一项数字人文研究的时候,一些重要的“中间概念”的文学解释意义,它的文学史,学术史的理论价值是值得深挖的。或者反过来说,也许我们应该从问题出发,去寻找可操作的、作为桥梁的中间概念和中间理论,做必要的历史勾连和意义阐明。为什么呢?这其实和可操作化作为数字人文的一个主要特征有关。就是说中间概念它一头连着文学史,文学批评史,文体论;另一方面,它必须可以测量,可以转化和对接实证。那么,去哪里找?
诚如很多人,还有姜老师都曾强调,一定要认识到,数字人文并非横空出世,它其实是深受社会科学实证量化的研究方法影响而兴起的。DHer一定要有社会科学素养,理解“假设-验证”框架的实操意义。具体到这个问题上,就是需要相信,你意识到的事情,社科中的某个前量化状态的学科中,肯定有人提出相似的概念和想法了,我们只要再往前推一小步,就很不容易了。这方面,像邱老师,郑文惠老师他们政大团队的数字概念史研究,就很好地做了理论和方法论方面的溯源工作,这就为他们的研究打下了一个扎实的基础。
当然大部分的情况是,我们的文学研究、文学理论研究、文学史研究本身有十分悠久的传统,已经是一个富矿了。像本研究中的“人物体系”,“人物功能”,以及最重要的,由可计算的“中介中心性”所提示的叙事中的“关键人物”等等,可以说都是其原有自的。那么,如何来计算?这就需要以角色对话情境为基础来构建引语网络,这里,“对话关系”这样一个概念之所以对李劼人这样的近、现代小说有相当重要的意义,除了前面已经说过的原因——和主题相关,另一方面也是受到晚清议政传统的影响使然,所谓以小道之言连缀“话柄”,连缀时事轶闻——当然,这和中国白话小说主潮是由宋元话本基础上发展起来的也有关。所有这些,都是值得我们去深入发掘、勾连的。
从另一个方向来说,尽管莫莱蒂的工作已经很晚了(2010年),他的图都是手工绘制,而且无权重、无方向,也没有将叙事聚焦作为变量引入中心性模型中,但是他为什么那么引人注目?从文学研究出发,我认为正是由于他很好地建构了中间概念。他重新发展了沃洛克(Alex Woloch)的人物空间概念,并且,其实是暗搓搓地把中心性、聚类、无标度网络等计算概念和人物论中已有的概念进行对标,因而提出了“人物分层的重新再概念化”的问题,也就是将人物按叙述功能的重要性重新做量化排布的想法。因此便可以起到重估“主要人物/次要人物”“主人公/小人物”“圆形人物/扁平人物”二分的作用,颠覆了既有的人物理论。但是我们其实都知道,这一思想从亚里士多德将人物视为“情节”之“功能”的理论中就有了,所以莫莱蒂做的更是“融合”的工作,以网络分析的手段融合了自古以来的“性格中心论”和“功能中心论”两大人物理论的流脉而已(《网络分析与人物理论》,《文艺理论与批评》2020年第2期)。我们必须承认,深挖这样的中间概念对于后面的工作是有价值的,它既有文学理论价值,又有现实的操作价值,既有学科“内部”的意义,又揭开了数字人文研究的前景。
这里还想说的一点,是很多中间概念其实也是典型的“计算批评”的概念。计算批评我最近强调得太多了,早在2017年的时候但汉松老师就有类似的提倡,他可能是直接启用了兰瑟姆他们的“算法批评”概念。那么在这里,计算批评,一言以蔽之,就是从抽象的统计表征和“文本细读”的结合部发力,从批评性的问题入手,利用计算方法,进行一种人文质询,试图发现于不同尺度上聚焦的“文本”生产背后更深刻的文化逻辑——也就是说,把数字人文变成一种批评途径,来施行批评家的职责,来和更大的文化框架对话,而不仅仅是做些实证的、功利性的研究工作。在这方面,芝大团队的研究提供了很好的范例,像他们用模式识别(机器学习的一种)的办法来研究美国现代主义时期的英语俳句,“潜在俳句”这个由实验产生的中间概念,其实就是一个典型的计算批评的概念,它的一半来自既往的批评史和学术史,另一半则来自测量、算法甚至是程序脚本。它让原先散见在个别诗作中可能是偶然的语言特征,在数百本期刊的观察尺度上,呈现了一个共享着特定要素的更大的文本集合,这样就将某种“观念流传中的俳句模式”给实实在在地展现出来了,让人们可以据此去探求某种“东方主义氛围”中诗学话语的生产机制。如此可以说,这样的计算批评概念,它有效地释放了限制在原先文学批评史视域中的潜能。再如朗、戴安德,朱远骋他们做的“重复”和东亚文学现代性的研究。他们通过实验设计,实际上是借助心理语言学和语料库语言学的测量手段,借助“重复”(对应着计算语言学的“冗余”等指标)这个概念,去发现了传统细读中难以归纳的、近代东亚文学史上大规模存在的语言文学现象,并对其成因做因素分析,并且,这种现象是跨语言成立的。(《从概念模型到计算批评:Franco Moretti之后的世界文学研究》,《西南民族大学报(人文社会科学版)》2020年第8期)
由于计算批评的核心是算法,所以可以做文章的地方也是算法,不能绕开。这里,我觉得这个研究,还是比较重视这一点的,虽然还远不理想。就是说,原先莫莱蒂的算法过于简单,网络布局可以是多端的,这点他自己也承认,所以最后他放弃了。那么我们就必须从他放弃的地方起步,经过反复试验和检索,我们在廖儁凡的基础上,确定了以角色对话关系为对象,让对话总量和对话情境成为数据挖掘点,改造算法,建立起叙事网。在本实验中,还专门比较了针对加权网络设计的 Opsahl(2010)和之前Gephi软件采用的经典算法Brandes(2001),最后得出略有差异的结果,这种差异特别显示在“改写本”和1937年版本《大波》上。所以也正是在这一差异的提示下,我们提出一个关键人物,或者说是“半真人”、中间阶层形象序列的设置问题。经过“细读”检验会发现,他们的行止,其实更暗含了李劼人对辛亥革命的理解,对革命主体的认识。如果将注意力放在这一类人物的功能探讨上,可以进一步发现李劼人习自英法的“历史的自然主义”与本土的龙门阵叙述是如何耦合在一起的。最后,回到我们关心的问题上,李劼人是否真的走在“典型化”的半途上?遵从“远读”的指引,我们是可以从大量湮没无闻的次要人物中,发现那些有价值有意义、有性格、有风格的功能元的。当然,这只是这个研究得出的结论之一。其他讨论,可参见《社会网络分析与<大波>三部曲的人物功能》,发表在《山东社会科学》2018年第9期上。
最后想说,这个探索比较早,大概在2015年上半年,算法没有经过统计检验,且文本量较小,只是初步获得了某种计算诗学的可行性。目前的工作是用晚清以来同样具有“摭拾话柄”特征的这一类新小说做更大规模的语料库,来从节点、群体和网络整体的层面上,对近世小说的体式构型和人物体系、人物观的演化做一个相对长时段的考察。这可能和欧洲同期的写实主义小说可以形成的抽象模式是不同的。这里将有一些有趣的问题,也将寻找更多有意味的可操作概念,比方说,如果同一时期文本中无标度网络大量出现,那么综合沃洛克、莫莱蒂、浦安迪等人的假设,再往前推一步,这可能是人物分布极不平等的一个表现,也是18-19世纪中期欧洲小说的一个特点,但却迥异于同一时期的中国章回体小说的人物布局。因此就可能重新激活一些问题,像“西洋小说技法刺激下晚清小说布局意识的转变和觉醒”,这种“转变”可以通过对网络结构的动态拓扑分析呈现出来吗?诸如此类的问题都值得尝试。
说一下这个探索方向我感觉到的一些问题:网络分析的作品现在越来越多了,但是目前可以看到的网络关系的提取和界定方法、关系计算和权重算法的设计,大都失之简单,这些我在《网络分析和人物理论》的结尾中已经提到了。从虚构作品中自动提取社交网络的原理看似简单,但在实践中是一项相当复杂的综合任务。所以另一种情况是,我们看到很多研究,有的发表规格很高,它在技术路径上具有探索意义,也很硬核,像对话网络,语义网络,语义对话网路,无监督的神经网络……但可能会让研究文学的人看了一笑置之,归根结底呢还是因为没有在中间环节上下功夫,无法获得贴切的文学解释,无法在不同学科的研究和评价框架间建立起有效关联和对话。在今天,尽管对叙事性文本内部的人物网络做分析,这种做法我们通常会追溯到弗朗科•莫莱蒂,但要知道他其实是从汉学家浦安迪对中国古典小说结构的研究中获得了灵光,也就是说,这种做法还是和中国小说有不解之缘的。而目前国际上尝试将它们做出来的也不乏其人。有鉴于此,希望我们至少可以从真问题出发,将基于情境的对话角色识别工具早日开发出来,于我们,这是责无旁贷的,所以也非常欢迎有兴趣的同道能够加入进来。
杨玲(评议人):
我对数字人文的了解是非常业余的,可能更多的是有一些问题想要请教几位老师。
首先是对于姜老师,您今天讲了两篇文章,但实际上我的问题主要集中在另一篇《数字人文文学研究与现代文学的兴起》。您在文章里提到了Cohen和Siskin对文类的看法,认为不同文类的划分归类是mediation(媒介化)的行为,而且这种行为产生了同一和差异的等级。我自己在研究网络文学的时候,对网络文学文类的演变也是非常感兴趣,但是就是不知道如何下手去实施这方面的研究,所以想请教您更详细地解释一下,这个mediation(媒介化)指的是什么,文类的划分为什么和媒介化相关?
还有一个问题,您在文章里还提到Siskin和Warner合写的一篇文章“Stopping Cultural Studies”(《停止文化研究》)。我自己是做文化研究的,我感觉国外的文化研究经常和媒介研究是合在一块的,所谓的Media and Cultural Studies。文化研究其实是非常关注媒介技术的,比如说现在有不少文化研究学者都在关注Platform Studies (平台研究),关注Algorithm(算法),所以我就想知道Siskin等人从事数字人文工作为什么会排斥文化研究?数字人文真的是一项纯粹的技术性研究,可以摆脱社会机制、权力关系的探讨吗?您在文中也提到了批判性的数字人文(Critical DH),那么Critical DH在整个DH里占什么样的位置?您怎么看数字人文和文化研究的关系?
姜文涛(嘉宾):
老师们提的问题都很有意思。我相对比较保守,在发言的时候一直在说“数字人文文学研究”。我们在谈到数字人文文学研究的时候,会常常提到莫雷蒂,他在2000年左右提出了“远读”的概念,许多人认为这是数字人文进入文学研究的一个里程碑的历史时刻(这一点,我不同意)。莫雷蒂在一个访谈里曾经说过,其他科学,比如化学、物理,在二十世纪发生了很大的变化、提出了很好的问题、对社会发展的推动力很大。他觉得我们文学研究在二十世纪并没有做出什么、对社会发展没有什么贡献。我其实并不赞同他的这个观点,我觉得二十世纪文学研究领域提出了很多方法、形成了很丰富的学术传统。其他两位老师提到融合论,我是赞同融合论的。当然,怎么融合,我个人觉得这会是一个很漫长的过程。
Ralph Cohen教授长期在美国弗吉尼亚大学英文系教书,是美国一个很著名的文学研究期刊《新文学史》(New Literary History)的创刊编辑,在文类genre方面做出了很大的学术贡献,我这里有一本他这方面论文的结集,回头发给杨老师。Cohen是Clifford Siskin教授的老师,Siskin是弗吉尼亚大学英文系毕业的,这是一个有光荣学术传统的英文系。Siskin更多是比较福柯式地理解知识类别和流传吧,他受福柯影响很大。美国一个非常重要的期刊叫《批评探索》(Critical Inquiry),他们十几年之前曾经组织了一个专期来讨论近代的知识流传和工具之间的关系,可以看看。
Siskin和William Warner都是北美英美文学研究的很好的学者,为什么反对文化研究,却推动数字人文文学研究的发展?他们可能只是反对某些文化研究吧。我觉得,他们也会反对某些数字人文研究的。对他们来说,英国十九世纪初建立文学研究这个大学学科,是对当时社会上技术革命的反应。这项技术革命就是写作,就是作为人们日常生活的印刷文化,这也包括阅读。写作无处不在,以致于你不去写作、不会阅读,也受到写作带来的知识和信息的影响。他们从这个角度来讲,觉得现在的数字媒体时代,数字技术、数字媒体就成了我们日常生活里不可忽视的一个部分,就像当时十九世纪初期建立文学研究这个近代大学学科的时候一样。这里面有一种历史类比。当然,这个类比也不无问题,这是可以讨论的。
杨玲(评议人):
邱老师的讲座我觉得也很有意思,您解构了传统的文学研究和数字文学研究的二元对立,提出了数字人文的文学研究是一种“增益的文学研究”,您的这个观点和姜文涛老师提到的国外学者马克•阿尔吉-休伊特(Mark Algee-Hewitt)所说的“增强版人文学科”是很一致的。但是您一方面解构了“传统的”与“数字的”这两种研究范式的对立,但同时又感觉您好像还是在二元对立的框架下面谈数字人文,提出所谓“真的数字人文研究”“假的数字人文研究”,有“数字之花”还有“塑料数字之花”。我们这个阶段是否需要建立一个评判数字人文研究优劣的标准?
戴安德和姜文涛老师的文章《数字人文作为一种方法》里提到,目前为止,数字人文研究的大多数项目没有推翻传统的预设,也没有产生新的叙事,只是在量化方面确认了我们已经知道的一些内容。我读您和其他学者合写的关于全唐诗的分析(《〈全唐诗〉的分析、探勘与应用-风格、对仗、社会网路与对联》)和刘知远的《词汇语义变化与社会变迁定量观测与分析》这两篇文章的时候,我的感觉是没有太多挑战我认知的新的东西。我想问,您觉得如何才能利用数字人文的工具生产出新的知识和观点?
邱伟云(嘉宾):
谢谢杨玲老师的两个问题。首先第一个问题是,为什么一方面要解构传统与非传统文学研究方法的二元框架,一方面又要树立起“真伪数字之花”的这个二元框架?需要在这个时期就建立起一个评判标准吗?
我们做数字人文研究的这群朋友,都亲眼看到了一段数字人文研究方法发展的历程,如果我们从知识社会学的角度看数字人文学的发展,就能看见其方法发展的轨迹。在数字人文学发展的第一阶段中,为能让数字人文方法能兴起与茁壮,所采取的主要态度就是让所有数字人文研究都能百花齐放,不管是“真”是“伪”,是好还是不好。但这里随之出现了一个问题,那就是在第一阶段中确实看到了同时包含著“真花”和“假花”的数字之花繁花盛开的景象,然而“假花”的生产速度很快,这让我们意识到一种“劣币驱逐良币”的危机,种一棵真花可能要种一个月,而假花只需要一天就能种出来,当学界看到的是一大堆的“塑料假花”时,那么就会对数字人文方法产生怀疑与否定的态度,非常不利于数字人文方法的永续发展。在看见这个危机之后,我们在《澳门理工学报》2019年第四期由桑海老师组织的笔谈中,发表了一组以《什么不是数字人文》为题的专栏文章,而对于此一问题的深入思考与讨论,揭示的正是数字人文方法进入到第二阶段的发展,开始退而远瞻的去审视数字人文方法的未来发展方向。如果有兴趣,可以去看桑海老师组织的那一组专栏,里面对这个问题进行了深入的讨论。
杨玲老师的第二个问题也是很好的问题。杨玲老师看了推荐的一些论文后觉得没发现什么新知识和新观点,这个问题我们也从方法学的角度思考过。数字人文研究方法有三种基本功能,第一是“验证”,验证前人做的研究结果。验证有什么作用呢?数字人文是一种新方法,通过验证前人的研究结果的正确性,得以树立其自身作为一种新方法的合法性。而数字人文研究方法的第二个功能是“修正”, 能够对前人的研究结果进行修正,通过修正能证明数字人文方法得以有别于前人提出的结论,从而证明数字人文方法的有效性。至于杨玲老师问的“数字人文研究能产生什么新知识和新观点”,这对应的是数字人文方法的第三个功能,亦即创造新说,这也是最难的阶段,亦即证明数字人文方法的主体性,必须要提出以前的学者无法提出的问题与研究结论。目前,参加我们数字人文研究的“同伙”还不够多,假如“同伙”越来越多,就会开展越来越多的研究,我们也就能更容易地见到一些能够回答这个问题的好例子。当然,我们团队之前做的研究里就可能已经有一些这样的例子,例如,胡适说“多谈些问题,少谈些主义”,针对这一说法我们就问了一个问题:中国近代有多少种主义?这个问题若要用人工方式去回答肯定很难,但我们用数字人文方法把它回答了,并且我们还观察了所找到的一千六百馀种“主义”,列出什么主义在什么时候开始出现,接下来又出现了什么主义,也就是说我们找出了主义的发展时间序列。像这样的问题就是过去的人文学者难以提出的问题,当我们发现这种在数字人文视野下才能带给我们的新问题并且回答后,所得到的研究结果,就是一种过去无法想见的新知识和新观点了。
杨玲(评议人):
赵薇这篇文章真的把数字人文方法落实到现当代文学的研究,做了一个很好的示范,让我们真正看到了数字人文工具所带来的新的文学研究的可能性。我也有几个问题。您在刚刚的presentation中谈到到底是要数据驱动还是方法驱动,而 Moretti谈到过理论的驱动,从理论的观念出发做数字人文研究,我想问您如何看待几种不同的驱动在数字人文研究中的应用?
第二个问题,您在《社会网络分析与“<大波>三部曲”的人物功能》那篇文章的结尾提到,“现代小说中具有较高‘中介中心性’的人物角色通常暗示了文本潜在的叙事意图”,我从这句话中嗅到了一丝丝“意图谬误”的味道,我有一点担心,数字人文方法运用到文学研究后,是否会导致文学解读的单一化?比如说数字人文学者能够自称发现文本的“真正的叙事意图”,从而提出某种“最客观”的解读,排斥其他主观化的解读,这就像意识形态批评那样的研究方法,总是声称自己能够发现隐藏在文学文本背后的某种“真相”,觉得自己是更高等、更好的学者。数字人文进入到文学研究之后会不会导致新的“等级”?
另外,作为从事大众文化研究,尤其是受众研究的学者,我比较关注受众对文本的解读,即所谓的解码(decoding)过程,我想问一下,这个DH对我们研究读者的文本解读是否会有一些帮助?
赵薇(嘉宾):
杨玲师姐提了几个很厉害的问题,第一个是“理论驱动”的问题。莫瑞蒂在近年来的访谈还有一些序言中总是说他的研究是“理论驱动”。对此该如何看待?我觉得这很符合他的实情。数字人文发展到现在,在数字人文文学研究中,也有很多人在提“大数据驱动”、“模式驱动”等,我对这些说法的态度一直是存疑的。文学研究是大开大阖的“远读”和强调个人审美感兴的文学阅读对冲很厉害的地方,研究全靠数据驱动是不能完成的;文学的数字人文研究在很多问题上必须依靠高精度的“知识驱动”,必需要重视“人的环节”,凸显研究者的主体性。莫瑞蒂本人是马克思主义理论家,他走的路子一直是理论家的路子,他的“远读”系列——我觉得还不是数字人文——也是理论驱动的(这是因为他其实并没有真正走到“建构模型”这一步),然而这在我们搞文学的看来都会感到很欣喜,会默认为是非常“好”的一种探索。这背后实际上也涉及到底怎么看待理论和批评的问题,理论是什么?模型是什么?史料是什么?批评又是什么?这些问题都相关联。但不论如何,我认为在现阶段,“理论驱动”还是比单纯的“数据驱动”要好一些。
第二个是“意图谬误”的问题。我在我自己的文章中提的其实是一个基于很小的样本得出的暂时结论,说的是“中介中心性” 在现代小说中,用我们的算法、我们建构网络的方式研究得出的结论也许提示、暗示了叙事的“潜在意图”,也就是说,我更关心的其实是“中介中心度”是否可以成为我做这样一个判断的“指标”。这个看法的得出是基于我对中国近代小说人物观演变的某个基本假设。比如说廖儁凡对《儒林外史》的研究,在古典小说里中介中心性最高的人物只单纯承担“跑过场”的职责;但到了后来的现代小说里面,这些跑过场的人物同时也具有了丰富而又意味的性格特征,他们的性格也成为小说风格很重要的组成部分。他们起到提示主题的作用,这其中似乎有着向典型人物发展的轨迹。
数字人文的文学研究也很难去发现作者独一无二的“原意”,而更多的恐怕是要破解这种定见。到底存不存在这样一个原本的文本的“本意”?以我写文章的立场,当然要彰显我提出的这样一种解读的合理性——这种解读在之前的文学批评史上没有或者很少存在过,我要从“远读”的角度将这种可能的解读公之于世。事实上,正如您也提到过的,我觉得“尺度阅读”(scalable reading)是一个把握“远读”的非常好的概念,即在不同的“比例尺”上远近拉动的阅读。“远读”从根本上讲还是一种统计学的表征,表征的方法是多种多样的(统计中也有各种类型的fallacy,其实正对应着新批评的那个“谬误”),它不是要把角度和解读单一化,而恰恰是还原世界表征多样性的一种方式,它提供了多种多样的看待世界的角度。在斯坦福文学实验室、芝加哥文本(光学)实验室的成果中,可以看到各式各样的阅读观察法,比如对主成分进行分析的“降维”阅读、对莎士比亚戏剧做聚类分析的文类阅读,还有对英语俳句做模式识别的阅读、对浪漫主义小说和日本私小说做多特征模型的对比阅读等等。这些多种多样的阅读不再是单一维度的比例尺就可以解释的,但这些阅读的结果有一个共同点,就是可以可视化——这也非常符合现代统计思维的特点。通过不同的坐标形式,无论是x轴和y轴的,还是三维的,折线图、散点图、网络图、甚至热力图等方式,“远读”实际上变成了“多维度阅读”,它跳出“看山是山,看水是水”的方式,“横看竖看、左看右看”,彻底跳出来看”的目的是看清原先单一尺度下无法看清的模式和规律,更是为了看出这个模式生成背后的社会历史原因。所以我的理解是,“远读”不是要把意图单一化,而恰恰是把它丰富化的过程。
徐爽(评议人):
我是来向大家学习的,对数字人文领域来说,我是一个“门外汉”,就来提一些简单的问题:首先,在邱伟云老师的论述中,我看到很多“文学之花”,觉得非常惊艳。而且以寻找关键词作为路径,数字人文确实提供了很多好的、快捷的方法。我的第一个问题是有关“塑料的数字之花”,没太听明白。另外,这个“渭河”的例子能否再稍微解释一下?
邱伟云(嘉宾):
徐爽老师提到的“渭河”的例子,我再稍微解释一下。有一篇已经发表的文章用《全唐诗》做材料去计算所谓的语义网络。作者在计算“渭河”这个语义后,发现它跟“鼓楼”、“华清池”、“华清宫”这样的一些语义处在同一个语义群里。作者根据数据解释,认为这些语义常常一起出现。但我回去对照《全唐诗》的语料后,发现这样的组合根本没有常常出现,只出现过一次。在我们看来,这位学者在计算完之后,应当再从数据去回对史料,回对史料后发现有问题,就应当去修改、纠正语义共现的计算方式,看看为什么这些语义的共现只出现一次,却会被计算出处于同一语义群。也就是说,我们的研究如果缺少回对史料的共读步骤,不考虑到计算模式也是可能有误而需要调整修正的话,就可能会出现类似这个例子中的错误问题。
徐爽(评议人):
赵薇老师打开了小说分析的很多途径,我非常感兴趣的是,她提到了可以用这种方法来“分析人物布局”,能否举一个具体的例子,或者说是怎么操作的,可以提示一下吗?然后我想稍微扩展一下,我来自法国,就说说法国的研究状况。法国的文学研究是以细读为传统的,至今细读文本仍占据文学评论的主要地位,所以法国文学评论界对数字人文研究方法的运用,和美国不太一样,保持很谨慎的态度,会提出一些认识论上的问题。综合一下我的观察,当前有以下几个方面的思考。第一,界面问题。耶鲁大学法国文学教授 Christophe Schuwey 在2019年出版的Interfaces. L’apport des humanités numériques à la literature(《界面:数字人文对文学的贡献》)一书中认为,数字人文带给文学研究的关键性的思考是界面问题,因为它改变了我们与文本、与书本以及与作者的关系。第二,文学与科技的关系。法国高等社会科学研究院的研究员Pierre Mounier在其著作 Les Humanités Numériques, une histoire critique(《人文数字,一段批评史》,2018)中提出,数字人文以科技为发展前提,人类会不会因此处于科技模式的控制之下?这就需要重新定义人和社会之间的道义契约。第三,数字社交性的概念。另一位法国文学教授Sophie Marcotte 从数字社交性和社会性促进小说的新发展这样一个角度来展开研究(La sociabilité numérique comme ressort de la fiction《作为小说推动力的数字社交性》,2016),因为数字社交性除了抽象的人际关系和人与人之间的感情接触以外,还引入了一个新的元素,即建立这个关系的工具、服务和设施,这让我想到了特别是在研究网络文学的时候,这个数字社交性能提供我们一些启示。最后,另外一些学者提出这么一些问题:我们如何定义文学中的数据,文学批评能否建立在计算之上?我们需要重新审视什么是文学研究,以及它的科学性 —— 当我们提到文学研究中的科学性,这是一个褒义词还是贬义词?
虽然法国文学界持比较保守的态度,但是不少大学已经开始设置数字人文的硕士班了,教程中,除了老师们刚才提到的一些方面,还教授线上写作的方式和文学形式等等。
赵薇(嘉宾):
徐爽老师刚刚提到,希望我能举一些具体的例子来说明“如何运用新的途径分析人物布局”,这在我之前报告的PPT中展示了一部分。此外,我在《山东社会科学》上发表的《社会网络分析与<大波>三部曲的人物功能》一文,和今后的一些论文里也会有更具体的分析说明。关于这一点,我之后可以再具体和您交流。
王玉玊(评议人):
其实我对数字人文也是个“门外汉”,我就简单说一下我听完分享后的一点收获吧。刚才邵老师提到我们《文艺理论与批评》杂志之前发表了数字人文的一组文章,其中也有在座几位老师的文章。这组文章受到了院里的重视,在学术界也有一定的反响。可见现在整个学术界对数字人文有越来越重视的倾向。因此,今天的讨论,尤其是着眼于数字人文方法和传统文学研究方法之间关系的讨论,是非常有意义的。
在听刚才三位老师的分享时,有一个让我非常感兴趣的点是赵薇老师提到的“中间概念”。我觉得所谓“中间概念”,其实是一个“翻译”的问题,就是把数字的、统计的方法翻译成传统的、文学意义的建构或表述。赵薇老师提到,这些中间概念不是凭空新造的概念,而是从既有的文学研究概念中发掘出的一些可以和数字方法相连接、相互转化的概念。从某种意义上讲,对于这样的中间概念的发掘,也是一种激活传统文学概念、激活传统文学研究方法的方式,也可说是邱老师提到的“数字人文方法‘增益’传统文学研究方法”的一个组成部分。另外,这种“翻译”工作还把数字方法的“理科思维”和传统文学研究的“文科思维”做了连接和转译。我们都知道理科思维和文科思维之间有着比较大的差别,而数字人文所做的这种连接正是它自身非常有魅力、同时也给我们带来挑战的一个方面。
然后,基于我的这种理解,有两个问题想要请教一下各位老师。首先是刚才各位老师都很强调的“可重复性”这个概念。各位老师举例讨论的也往往是一些已经被归纳出来、在不同文本中可重复操作的方法、技巧和文学概念,但实际上在文学中不可避免地存在着某些不可重复的、独创性的要素,这些内容能否成为数字人文文学研究中的组成部分?或者说,这些要素怎样存在于数字人文的研究范式里?其次,对于数字人文的“翻译”,无论是研究过程中的数字方法,还是最后得出的结果,在把它们转译到文学研究的表达中时,我们该如何去判断这些“翻译”自身的正确性?比如,如果我根据既往的经验,对一个文学现象有某种判断,但当我用数字方法去验证这个判断时,却发现结果与预期不同,这时我该如何去判断究竟是我的经验出了错,还是我使用的数字方法有问题?除了依靠个人经验,还有没有一些比较通行的思路和方法可以参考和借鉴?老师们能否通过自己的研究经验来做一些解答?
赵薇(嘉宾):
关于玉玊的问题,即“中间概念”是否就是翻译、转译的过程。我觉得她的理解非常好,比我刚刚说的更好。“中间概念”是我前两天刚刚概括出的想法。实际上邱老师在这方面有过更理想的表述,去年去我们文学所,邱老师的报告里介绍了政大团队的整个流程:先由文学学者提出传统人文研究的议题(Question),再由统计学者转译成可以量化的理论建模(methodology),接着由计算机学者进行编程和计算(Technology),最后再由人文学者进行应用诠释(Application)。我觉得他对人文研究诠释循环的概括已经非常好了。
从邱老师的这个诠释循环出发,我认为对于文学的数字人文研究来说,我们比较容易对接和对话,甚至亲自操刀的是第二个环节:由统计学者转译成可以量化的理论建模,这一点上,我跟邱老师想表达的意思是一样的,只不过,对文学研究来说,最开始我们更需要从文学批评、问题史中去寻找、形成可以“转译”的重要问题。可计量的概念的寻找非常重要,我们也可以到文学之外的邻近学科中去寻找,尤其是社会科学里的。我一直强调量化的文学社会学,姜老师之前也提到这点,邵老师做的文学场域研究也是文学社会学的研究。文学社会学中有很多现成的概念可以被我们使用,今天有很多朋友在直播中问到网文研究,特别是涉及到网文生产、文化生产这部分,社会学的方法是很有效的。斯坦福文学实验室就发表过一些关于声望、流行度的文章,这些文章其实都是对一些现成的社会学概念做量化。社会学本身已经是量化的学科,文学研究自身也有长久的“经验研究”传统,可以借由这些概念去打通文学研究到数字人文的路径。如何寻找合适的中间概念,或者说转译概念,是需要我们去好好下功夫的。
邱伟云(嘉宾):
玉玊的问题我再补充一下。理科跟文科思维还是有差别,我常常说数字人文学者是要养成的,必须要培养中间人。赵老师提到,我们要去把人文问题进行量化转译,这种转译是需要功力的,要去思考怎么样可以进行量化的提问。这要怎么去学呢?有点难,只能通过不断学习已有研究,慢慢产生感觉。我们只有完成量化转译,才能够去进行较好的数字研究,而不是像刚才我讲的拿来主义。为什么现在出现很多拿来主义式的“伪数字之花”,就是因为他们不去花脑筋思考,而是直接拿来方法,把数据丢进去,等一个结果。但是其实数字人文的每一套方法都必须不断配合研究的问题来进行调整的。
玉玊刚刚还有一个问题问得很好,文学有独创不可重复的存在,这一点是如何存在于数字人文研究之中的,这是很值得去研究的好问题。刚才两位老师有谈到俳句研究,有学者建立了一个俳句模型,将材料放进去之后,出现了一个像是俳句又不像是俳句的材料,被叫做“潜在俳句”。
赵薇(嘉宾):
“潜在俳句”是被机器误判为俳句的文本集合,也就是把原先批评家们认定为“俳句”的范围给扩大了。机器认定的俳句可能在我们的批评史上是根本不存在的,它们不被认为是“俳句”,甚至不被认为是“诗”。
邱伟云(嘉宾):
和这种“潜在俳句”类似,我们在研究当中也发现了一些跳出原有规律的现象,这也是人文学者可以去研究的。历史学家王汎森先生曾经有一个论点,叫做研究历史中的空白。我们历史学者总会去研究“历史之有”,但是王汎森先生告诉我们,那些史料中没有的东西、空白的地方也可以研究。换言之,我们做数字人文,是去寻找规律,那些跳出规律的东西其实也值得去研究。玉玊提到“不可重复的存在”或许可以从这个角度再去讨论。
赵薇(嘉宾):
文学阅读和研究的独创性能否成为数字人文研究的组成部分,这让我想到一个非常实际的问题。我们现在的数字人文研究,常常去寻求已经建好的一些数据库、语料库平台的帮助,直接从中找数据、找现成关系开始研究,它们的算法都是建库的人内置好的。但是对于文学研究来说,特别是对所谓的文学“内部研究”来说,这种做法可能是要讨论一下的。我也记得王晓光老师曾经说过,当前的基础设施有两种趋势:一种是一对一设计,根据人文研究的具体需求进行相应的技术开发,也就是和人文学者进行真正的合作研究;另一种则是建立更大的通用型平台,通过调用API,打通各大平台,或者,建设某种人文学者可以自主上传资料,进行简单数据分析的所谓专题型平台,这可能是更大的一种趋势。我在《网络分析与人物理论》的最后部分中也提到过,针对大多数文学研究,还是需要极其个性化的设计,才能对问题有更细致精微的把握,但这在现实中有相当的难度,需要舍得投入时间和精力成本,需要耐得住寂寞,这对人文学者实际上是一种新挑战。在陈静老师去年组织的“定义数字人文”的研讨会上,我也一直在提问,深度合作到底如何实现?我觉得这个疑问还是有一定代表性的。
邱伟云(嘉宾):
刚才玉玊还有个问题我没有回答到。文学工作者会对于文学有自己的判断,但是如果通过数据验证之后,出现了不同或者相反的现象,那么这到底是文学工作者的经验出错还是计算方法的问题?如果遇到这样的问题,我们会拿出来进行讨论,如果证明是工具的问题,我们就会修改工具。如果是既有经验的问题,是我们原来的经验框架不足以想象和解释新现象,那么这或许就是一个新知识或新观点的发现。面对运用数据验证后出现与过去人文经验的判断不同或相反的现象,其实我们是很高兴的,因为这就是你推陈出新的契机与可能。
高寒凝:
赵薇老师您好,拜读了您在《文艺理论与批评》上关于网络分析与人物理论的论文,看到您梳理的过往研究,大多是针对单篇作品内部的人物网络结构。但我一直是在做网络文学研究,网络文学的一个重要特点是类型化,这种类型化有时会表现为大规模的“同题”写作:相似的故事背景、大量重合的人物等等。想请教赵薇老师的是,网络分析的技术方法有没有可能处理分布在大量不同作品中的相同(或至少是原型相同)人物之间的通约关系?这类“同题”写作的类型文的人物网络结构,有可能借此形成某种跨作品的可视化网络么?
赵薇(嘉宾):
过往的网络分析研究都是针对单篇作品的内部研究,而网络文学的一大特点是类型化,大量作品中会出现相似的故事背景、重合的人物,是否能够通约处理,用人物网络结构来做。我觉得这是特别好的想法。网络文学的类型化大家有目共睹,它的生产也是类型化生产,是可以通过巧妙的设计,用某种分类手段实现出来的。因为我们知道“分类”算是数字人文中的一种典型任务了,比如上图-芝大的民国期刊语料库项目目前就涉及到文体区分的问题,通过不同的技术路径来划分文类,或进行文类研究。所以网络文学的类型化,也许可以从风格上,比如语词水平、句子水平,段落和篇章水平进行区分。
寒凝说的网络结构的类型化,我觉得是非常好的思路。也许我们可以试着把网络小说中的人物关系全部做出来,再建立一系列对照组,看他们整个的人物体系在形态上面有没有一些共同的特点,我觉得这是可以操作的。它的困难还是提取工具和关系界定的问题。关系如何提取?怎么界定关系?要提取什么样的关系?在何种程度上能够实现自动化的提取?如果纯靠人工来提,工作量是不可想象的。这些问题都是我们所有人共同面对的。我目前看到的一些研究还是以国外为主,不是针对汉语写作的,对我们并不一定适用。上次郑永晓老师也提醒我,小说是“文备众体”。我想他的意思是说叙述话语的层次是非常多的,这里面也就存在着不可通约性。其实,先不说叙述话语,就连“对话”和转述体,间接引语和直接引语都是没法通约的,那么,像我们现在看到的一些代表性研究,如果只靠语词“共现”,把所有语义或句法关系一股脑提出来,那这到底是一种什么关系?现在如果依靠无监督来做,再结合一定的人工标注量,也许会有好的收效,但是提取出的关系仍然要接受文学解释、文学研究的审视,我觉得是非常巨大的挑战。但我觉得这是可以去尝试的,你可以去展开,我非常期待。
项蕾:
邱老师好,在分享中,您提到了克思奇对数字人文的批判,也从中西方学术在环境、传统上的不同入手,回答了克思奇批判在中国文学研究界是否当真具有意义的问题。我想从媒介角度,再在您分享的基础上提问。部分西方数字人文学者在进行理论研究时,会将人文学科回溯至文艺复兴时期对古希腊文献的整理、誊抄、翻译和校对,将人文学者做的事视作新媒介时代对上个时期知识的重新阐发,数字人文则是印刷文明与数字文明之交的版本。
在这里,克思奇有非常明显的价值判断,他将文字、思想、创作视为“人文”的,将图像、制作和编码视为“非人文”的,这其实是忽视了媒介革命会使人文本身也发生变化的体现。一个时代有一个时代的人文学术,其本质在于一个时代有一个时代的人文底色。口传文明时代,音声旋律是人类思想和情感最青睐的介质;印刷文明时代,文字因技术走向顶峰,也借此成就了神圣性;如今,数字文明时代即将来临,在新媒介环境下成长起来的孩子,可能从小就具备和“读字”一样强的“读图”、“读数”能力,这种媒介的变革会带来人文价值的再度更新。
所以,在数字人文研究水准问题之外,会不会存在这样一种视角,克思奇批判和数字人文从底层逻辑上根本不一样。当我们跳出这个二元框架,我们将在一个,如麦克卢汉所述,感官比率更加平衡的状态下,重新回望文学的伟大传统,厘清很多过去没能厘清的问题,比如重新回答“什么是文学性”的问题,并找到新媒介时代人文学术的锚点,寻得一个更合适的方式来解读新媒介文艺作品?
邱伟云(嘉宾):
项蕾的问题,我觉得本身已经在回应克思奇对数字人文的批判,是在对克思奇命题进行挑战。我觉得你从媒介演变的角度去想去反思、去商榷克斯奇的讨论是很适合的。我非常期待项蕾写出一篇论文,来跟克思奇进行讨论,把这个问题深挖下去。
最后,我再回应一下聊天室里一些朋友的问题。很多同学表示现在想要做一些相关的数字人文研究,但对相关研究工具不熟悉,问我们能不能介绍几个。工具是很多的,但是怎么使用才是大问题。就像赵老师刚刚讲的,我们在做网络分析的时候,我们会去思考所谓的共现关系怎么样计算才比较好,我们会有一套比较。现在如果我提供给你工具,你完全不知道工具是如何进行计算的,你也没办法对工具进行修改。如果你这样去使用工具,你就没有办法体现出你作为研究者在进行数字人文研究时应当具有的主体性,你的研究结果是被工具所宰治的。现在都有很多工具可以使用,关键是向大家提供工具后,大家一定要去深入思考这些工具是怎样被设计的,背后的计算原理是什么,你同不同意他所采用共现、语义共现的这套算法。只有你同意其中的所有内涵,你才能够去使用这套工具。这是我要补充的一点。
王军(主办人):
数字人文打造了一个跨学科交流平台,它让每个学者都获得了重新塑造自己知识结构的机会,我们更要以积极进取的开阔心态迎接变化。我们讨论的好像是一个新问题,但实际上是现行教育体制巨大缺陷造成的旧问题。过去的教育理念是培养一个完整的人,但是随着学科分化,我们被挤压到了一个个细细的分类里。每个人都面临着教育体制带来的烙印。因为这个问题没有解决,我们今天才会讨论数字人文。在新的环境里,每个人都需要自发地完善自身的知识结构,文科生需要学习数字方法和技术,理科生需要回归到社会、回归到人的自身。学科大交叉的领域拓展刚刚开始,在数字化和智能化的时代里,我们还有许多工作要做。
邵燕君(主持人):
学者们的纯粹激情正是新学科的朝阳,而网络这个新的媒介环境更使它们交融碰撞。如今在场的活跃于数字人文领域的新锐学者、深耕于文学研究领域的资深学者和成长于数字文明时代的未来学者,对数字人文的方方面面进行辨析与畅想,其本身就是数字人文式的。
未来学者论坛|时代精神:历时文本关键词提取与解读 ——基于《人民日报》文本的实践
校对 | 肖爽
美编 | 徐璇
转 载 请 联 系 授 权